CN115938382A - 降噪控制方法、装置、设备及存储介质 - Google Patents

降噪控制方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115938382A
CN115938382A CN202310248810.8A CN202310248810A CN115938382A CN 115938382 A CN115938382 A CN 115938382A CN 202310248810 A CN202310248810 A CN 202310248810A CN 115938382 A CN115938382 A CN 115938382A
Authority
CN
China
Prior art keywords
processed
audio
original
signal
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310248810.8A
Other languages
English (en)
Other versions
CN115938382B (zh
Inventor
卢升中
卢升伟
卢升科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN YALE ELECTRONICS CO Ltd
Original Assignee
SHENZHEN YALE ELECTRONICS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN YALE ELECTRONICS CO Ltd filed Critical SHENZHEN YALE ELECTRONICS CO Ltd
Priority to CN202310248810.8A priority Critical patent/CN115938382B/zh
Publication of CN115938382A publication Critical patent/CN115938382A/zh
Application granted granted Critical
Publication of CN115938382B publication Critical patent/CN115938382B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明公开一种降噪控制方法、装置、设备及存储介质。本发明通过获取音频文件对应的原始音频信号和音频文件初次播放后的待处理音频信号,然后将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,再根据噪声信号对待处理音频信号进行降噪处理。本发明能够得到原始音频信号对应的特征向量和经过音响设备播放后的待处理音频信号对应的特征向量,精确地得到音频文件经过音响设备初次播放后的噪声信号,并根据噪声信号进行降噪处理,从而能够对经过降噪处理后的待处理音频信号进行再次播放,有效地降低音响设备产生的噪声。

Description

降噪控制方法、装置、设备及存储介质
技术领域
本发明涉及噪声处理技术领域,尤其涉及一种降噪控制方法、装置、设备及存储介质。
背景技术
在现场扩音的音响系统中,噪声问题是一个普遍存在又非常令人头痛的问题。通常组成音响系统的设备越多,或传输出距离越长,系统的背景噪声就越大,甚至使得音响系统无法进行正常的录音或扩音工作。因此,如何有效地降低音响设备产生的噪声,成为一个亟待解决的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种降噪控制方法、装置、设备及存储介质,旨在解决如何有效地降低音响设备产生的噪声的技术问题。
为实现上述目的,本发明提供了一种降噪控制方法,所述降噪控制方法包括以下步骤:
获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号;
将所述原始音频信号和所述待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量;
根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号;
根据所述噪声信号对所述待处理音频信号进行降噪处理。
可选地,所述获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号的步骤之前,还包括:
获取原始音频文件中的音频数据和所述原始音频文件对应的文件格式;
根据所述音频数据和所述文件格式判断所述原始音频文件是否需要修复;
若是,则对所述原始音频文件中的待修复区域进行标记,获得携带标记的音频文件。
可选地,所述根据所述音频数据和所述文件格式判断所述原始音频文件是否需要修复的步骤,具体包括:
将所述文件格式与所述音频数据对应的采样频率和采样大小进行匹配;
若匹配通过,则获取所述音频数据中的各帧音频数据;
获取所述各帧音频数据中的缺失数据对应的目标帧音频数据;
根据所述目标帧音频数据判断所述原始音频文件是否需要修复。
可选地,所述获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号的步骤,具体包括:
根据所述原始音频文件从预设音频库中选取目标音频文件;
选取所述音频文件中携带标记的待修复区域,并根据所述目标音频文件对所述待修复区域进行优化,获得优化后的音频文件;
获取所述优化后的音频文件对应的原始音频信号和所述优化后的音频文件初次播放后的待处理音频信号。
可选地,所述根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号的步骤,具体包括:
根据所述待处理特征向量确定所述待处理音频信号对应的播放设备类型;
根据所述播放设备类型确定所述待处理音频信号中的设备噪声信号;
根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的原始噪声信号;
根据所述原始噪声信号和所述设备噪声信号确定所述待处理音频信号中的噪声信号。
可选地,所述根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的原始噪声信号的步骤,具体包括:
将所述原始特征向量和所述待处理特征向量进行频率划分,获得划分后的原始特征向量和划分后的待处理特征向量;
获取相同频率范围内的原始特征向量和待处理特征向量之间的相似度;
根据所述相似度确定所述待处理特征向量中的异常特征向量;
根据所述异常特征向量确定所述待处理音频信号中的原始噪声信号。
可选地,所述根据所述噪声信号对所述待处理音频信号进行降噪处理的步骤,具体包括:
对所述噪声信号进行音质分析,获得音质分析结果;
根据所述音质分析结果确定所述待处理音频信号的优化方式;
根据所述优化方式对所述待处理音频信号进行降噪处理。
此外,为实现上述目的,本发明还提供一种降噪控制装置,所述降噪控制装置包括:
信号获取模块,用于获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号;
特征提取模块,用于将所述原始音频信号和所述待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量;
信号确定模块,用于根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号;
降噪处理模块,用于根据所述噪声信号对所述待处理音频信号进行降噪处理。
此外,为实现上述目的,本发明还提出一种降噪控制设备,所述降噪控制设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的降噪控制程序,所述降噪控制程序配置为实现如上文所述的降噪控制方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有降噪控制程序,所述降噪控制程序被处理器执行时实现如上文所述的降噪控制方法的步骤。
本发明通过获取音频文件对应的原始音频信号和音频文件初次播放后的待处理音频信号,然后将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,再根据噪声信号对待处理音频信号进行降噪处理。本发明通过将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量,能够得到原始音频信号对应的特征向量和经过音响设备初次播放后的待处理音频信号对应的特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,能够精确地得到音频文件经过音响设备初次播放后的噪声信号,并根据噪声信号对待处理音频信号进行降噪处理,从而能够对经过降噪处理后的待处理音频信号进行再次播放,有效地降低音响设备产生的噪声。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的降噪控制设备的结构示意图;
图2为本发明降噪控制方法第一实施例的流程示意图;
图3为本发明降噪控制方法第一实施例的应用场景示意图;
图4为本发明降噪控制方法第二实施例的流程示意图;
图5为本发明降噪控制方法第三实施例的流程示意图;
图6为本发明降噪控制装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的降噪控制设备结构示意图。
如图1所示,该降噪控制设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对降噪控制设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及降噪控制程序。
在图1所示的降噪控制设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明降噪控制设备中的处理器1001、存储器1005可以设置在降噪控制设备中,所述降噪控制设备通过处理器1001调用存储器1005中存储的降噪控制程序,并执行本发明实施例提供的降噪控制方法。
基于上述降噪控制设备,本发明实施例提供了一种降噪控制方法,参照图2,图2为本发明降噪控制方法第一实施例的流程示意图。
本实施例中,所述降噪控制方法包括以下步骤:
步骤S10:获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号;
需要说明的是,本实施例的执行主体可以是一种具有数据处理、网络通信以及程序运行功能的计算服务设备,例如手机、平板电脑、个人电脑等,或者是一种能够实现上述功能的电子设备或降噪控制设备。以下以所述降噪控制设备为例,对本实施例及下述各实施例进行说明。
可理解的是,音频文件是指预先存储在音响设备中,或者存储在与音响设备连接的计算机中,或者存储在需要通过音响设备进行播放的设备中,可能经过部分处理得到的音频文件,部分处理可以是对未经过任何处理的原始音频文件进行优化处理,优化处理可以是滤波、去噪处理等。音响设备可以是扩音器、音箱、麦克风等,本实施例对此不做具体限制。原始音频信号可以是指原始音频文件在忽略环境噪声以及音响设备播放时噪声的理想状态下被播放时得到的纯净音频信号。
应理解的是,音响设备在正常状态下初次播放该音频文件,同时进行音频采集后得到待处理音频信号,此时待处理音频信号中可能包括音响设备的播放噪声和环境噪声。
具体实现中,音响设备需要先将待处理音频信号中的环境噪声剔除,得到包含音响设备的播放噪声的待处理音频信号,然后根据该待处理音频信号对自身的播放噪声进行抑制,以保证音频文件在后续播放时,具有更好的音效。
其中,上述环境噪声的剔除方式可以是先获取音响设备的播放场景,例如室内安静环境、室内嘈杂环境、室外安静环境、室外嘈杂环境、车流量多的环境等,然后确定在该播放场景下的所有环境噪声类型,例如工业噪声、建筑噪声、交通噪声、社会生活噪声等,再确定该环境噪声类型对应的环境噪声,即可对待处理音频信号中的环境噪声进行剔除。
步骤S20:将所述原始音频信号和所述待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量;
需要说明的是,预设语音特征提取网络是指预先设置的用于提取语音的特征向量的深度学习网络,例如线性预测编码、卷积神经网络等,特征向量能够反映说话的语音信息。
在具体实现中,将原始音频信号和待处理音频信号分别输入至预设语音特征提取网络中,可获得原始音频信号对应的原始特征向量和待处理音频信号对应的待处理特征向量。具体地,先对原始音频信号进行预加重、分帧和加窗,然后对每一个短时分析窗,通过FFT得到对应的频谱,然后将该频谱通过Mel滤波器组得到Mel频谱,再在Mel频谱上面进行倒谱分析(取对数,做逆变换,实际逆变换一般是通过DCT离散余弦变换来实现,取DCT后的第2个到第13个系数作为MFCC系数),获得Mel频率倒谱系数MFCC,即原始音频信号对应的原始特征向量,对于待处理音频信号也可采用上述方式进行语音特征提取,得到待处理特征向量。
步骤S30:根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号;
可理解的是,音响设备播放时噪声可能会存在于采集到的待处理音频信号中,该噪声的产生原因可能是音响设备中相关电子元件的老化所导致的,也可能是音响设备的硬件选材不佳所导致的。
在具体实现中,本实施例可根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,具体可以将原始特征向量与待处理特征向量进行对比,将特征向量存在较大差异的部分作为噪声信号对应的噪声特征向量,进而根据噪声特征向量确定待处理音频信号中的噪声信号。进一步地,可以先获取原始特征向量与待处理特征向量之间的向量相似度,在向量相似度大于或等于预设阈值时,说明该向量相似度对应的原始特征向量和待处理特征向量较相似,可忽略此时产生的噪声信号;在向量相似度小于预设阈值时,截取该向量相似度对应的原始特征向量和待处理特征向量,根据上述截取到的原始特征向量和待处理特征向量确定噪声特征向量,进而根据噪声特征向量确定待处理音频信号中的片段噪声信号,即一段待处理音频信号中的多个片段噪声信号。
步骤S40:根据所述噪声信号对所述待处理音频信号进行降噪处理。
应理解的是,由于音响设备的上述硬件缺陷会导致音频文件播放时产生噪声,因此本实施例降噪控制方法在不更换音响设备的硬件的前提下,通过确定待处理音频信号在播放过程中的噪声信号。然后对这些播放噪声信号进行分析,并根据分析结果(例如音效失真或音频过高或者音频过低等)确定对待处理音频信号的优化方式,然后再通过该优化方式对所述待处理音频信号进行降噪处理。
进一步地,为了有效地进行降噪处理,在本实施例中,所述步骤S40包括:对所述噪声信号进行音质分析,获得音质分析结果;根据所述音质分析结果确定所述待处理音频信号的优化方式;根据所述优化方式对所述待处理音频信号进行降噪处理。
可理解的是,噪声信号可包括多个片段噪声信号,可对各个片段噪声信号进行音质分析,具体可以是对各个片段噪声信号的频率、大小等进行分析,得到音质分析结果,音质分析结果可包括音效失真、音频过高、音频过低等,音效失真是指片段噪声信号的波形异常,音频过高是指片段噪声信号的频率过高。
应理解的是,待处理音频信号的优化方式可包括对待处理音频信号的频率进行更改,或者对待处理音频信号的大小进行更改等方式,以对初次播放后的待处理音频信号进行降噪处理。例如:在音质分析结果为音频过高时,可对音频过高的噪声信号对应的待处理音频信号的频率增大;在音质分析结果为大小过大时,可对大小过大的噪声信号对应的待处理音频信号的大小减小。
在具体实现中,本实施例可对初次播放后的待处理音频信号进行降噪处理,以使在使用该音响设备再次对上述音频文件进行播放后,能够对降噪处理后的待处理音频信号进行播放,以播放纯净的声音,提高用户体验。
具体地,参照图3,图3为本发明降噪控制方法第一实施例的应用场景示意图。如图3所示,将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,预设语音特征提取网络中可依次包括:卷积层、卷积层、池化层、卷积层、池化层、全连接层,即可得到原始特征向量和待处理特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号。
本实施例通过获取音频文件对应的原始音频信号和音频文件初次播放后的待处理音频信号,然后将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,再根据噪声信号对待处理音频信号进行降噪处理。本实施例通过将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量,能够得到原始音频信号对应的特征向量和经过音响设备初次播放后的待处理音频信号对应的特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,能够精确地得到音频文件经过音响设备初次播放后的噪声信号,并根据噪声信号对待处理音频信号进行降噪处理,从而能够对经过降噪处理后的待处理音频信号进行再次播放,有效地降低音响设备产生的噪声。
参考图4,图4为本发明降噪控制方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S10之前,还包括:
步骤S01:获取原始音频文件中的音频数据和所述原始音频文件对应的文件格式;
可理解的是,原始音频文件是指是指预先存储在音响设备中,或者存储在与音响设备连接的计算机中,或者存储在需要通过音响设备进行播放的设备中,未经过任何处理的音频文件,也就是未经过滤波、去噪等处理的音频文件,原始音频文件可对应数字化的声音数据。文件格式是指原始音频文件对应的音频格式,例如:MP3、WAV、WMA等,文件格式可通过原始音频文件的后缀名或者原始音频文件中的音频数据的采样频率等方式得到。
步骤S02:根据所述音频数据和所述文件格式判断所述原始音频文件是否需要修复;
应理解的是,在原始音频文件出现损坏时,说明原始音频文件需要被修复,出现损坏可以是原始音频文件中的部分数据缺失,也可以是原始音频文件中的部分数据异常,还可以包括其他损坏情况,本实施例对此不做具体限制。
在具体实现中,本实施例可根据音频数据和文件格式共同判断原始音频文件是否需要修复。具体判断方法可以是判断音频数据和文件格式是否匹配,即判断音频数据对应的采样频率、音质等信息是否与文件格式匹配,还可以判断音频数据中是否存在数据缺失或数据冗余的部分,还可以通过其他方式判断,本实施例对此不做具体限制。
进一步地,为了精确判断原始音频文件是否需要修复,在本实施例中,所述步骤S02包括:将所述文件格式与所述音频数据对应的采样频率和采样大小进行匹配;若匹配通过,则获取所述音频数据中的各帧音频数据;获取所述各帧音频数据中的缺失数据对应的目标帧音频数据;根据所述目标帧音频数据判断所述原始音频文件是否需要修复。
可理解的是,在采集音频数据时,可根据采样频率和采样大小进行采集,采样频率是指单位时间内的采样次数,采样大小是指每次采样的样本值大小,每一份音频数据可对应固定的采样频率和采样大小。
应理解的是,每一种文件格式可对应不同的采样频率范围和采样大小范围,因此,本实施例可将文件格式与音频数据对应的采样频率和采样大小进行匹配,在采样频率处于原始音频文件的文件格式对应的采样频率范围内且采样大小处于原始音频文件的文件格式对应的采样大小范围内,说明此时匹配通过。若匹配不通过,则直接判定该原始音频文件需要修复。
在具体实现中,若匹配通过,可对音频数据进行分帧处理,得到音频数据中的各帧音频数据,也就是每一次采样到的音频数据,然后获取各帧音频数据中的缺失数据,即各帧音频数据中缺失的数据,并将缺失数据所在的帧作为目标帧,将目标帧中的音频数据作为目标帧音频数据。本实施例可根据目标帧音频数据判断原始音频文件是否需要修复,具体判断方法可以是判断目标帧音频数据中的缺失部分是否过多,或者目标帧音频数据中的数据变化是否过快,若缺失过多或变化过快,则原始音频文件需要修复,还可以根据实际情况设置其他判断方式,本实施例对此不做具体限制。
本实施例将文件格式与音频数据对应的采样频率和采样大小进行匹配,能够初步判断原始音频文件是否需要修复,若匹配通过,则获取音频数据中的各帧音频数据,然后获取各帧音频数据中的缺失数据对应的目标帧音频数据,根据目标帧音频数据判断原始音频文件是否需要修复,能够根据缺失数据进一步判断原始音频文件是否需要修复,以获取原始音频文件中的待修复区域。
步骤S03:若是,则对所述原始音频文件中的待修复区域进行标记,获得携带标记的音频文件。
可理解的是,若原始音频文件需要修复,则对原始音频文件中的待修复区域进行标记,待修复区域可以是音频数据异常的区域,例如:缺失音频数据的区域,数据变化较快的区域等,在对上述音频数据异常的区域进行标记后,即可得到携带标记的音频文件。
应理解的是,若原始音频文件不需要修复,则将原始音频文件作为音频文件,以进行后续的降噪处理。
进一步地,为了精确确定原始音频信号和待处理音频信号,在本实施例中,所述步骤S10包括:根据所述原始音频文件从预设音频库中选取目标音频文件;选取所述音频文件中携带标记的待修复区域,并根据所述目标音频文件对所述待修复区域进行优化,获得优化后的音频文件;获取所述优化后的音频文件对应的原始音频信号和所述优化后的音频文件初次播放后的待处理音频信号。
需要说明的是,预设音频库为预先设置的音频库,可包含需要进行降噪的音响设备播放的所有音频文件,并且所有的音频文件没有任何损坏,预设音频库可预先存储在与音响设备连接的计算机中,或者存储在与音响设备连接的移动设备中,本实施例对此不做具体限制。
可理解的是,本实施例可根据原始音频文件从预设音频库中选取目标音频文件,目标音频文件是指预设音频库中与原始音频文件相同或相似的音频文件,具体可以先获取预设音频库中所有音频文件对应的文件格式,并获取原始音频文件对应的文件格式,将所有音频文件对应的文件格式与该文件格式进行匹配,得到与原始音频文件对应的文件格式相同的在预设音频库中的筛选后的音频文件,然后获取筛选后的音频文件对应的文件大小,再将筛选后的文件大小与原始音频文件对应的文件大小进行匹配,将文件大小相同或相差较小的音频文件作为目标音频文件。
应理解的是,在对原始音频文件中的待修复区域进行标记后可得到音频文件,该音频文件中存在携带标记的待修复区域。本实施例可根据目标音频文件对待修复区域进行优化,优化方式可以是获取目标音频文件中与待修复区域相同的区域,具体可先获取待修复区域所处的帧,然后确定该帧对应的帧标号,也就是处于原始音频文件中的第几帧,即可根据帧标号确定目标音频文件中与待修复区域相同的区域,然后将该区域对待修复区域进行替换,即可得到优化后的音频文件。
在具体实现中,本实施例可对损坏的原始音频文件进行优化,得到优化后的音频文件对应的原始音频信号和优化后的音频文件初次播放后的待处理音频信号,从而使得到的原始音频信号和待处理音频信号更加精确。
本实施例根据目标音频文件对待修复区域进行优化,获得优化后的音频文件,以对原始音频文件进行优化,得到优化后的音频文件,然后获取优化后的音频文件对应的原始音频信号和所述优化后的音频文件初次播放后的待处理音频信号,从而使得到的原始音频信号和待处理音频信号更加精确。
本实施例通过获取原始音频文件中的音频数据和原始音频文件对应的文件格式,然后根据音频数据和所述文件格式判断原始音频文件是否需要修复,若是,则对原始音频文件中的待修复区域进行标记,获得携带标记的音频文件。本实施例根据音频数据和所述文件格式判断原始音频文件是否需要修复,若是,则对携带标记的音频文件进行优化,从而使得后续得到的原始音频信号和待处理音频信号更加精确。
参考图5,图5为本发明降噪控制方法第三实施例的流程示意图。
基于上述各实施例,在本实施例中,所述步骤S30包括:
步骤S301:根据所述待处理特征向量确定所述待处理音频信号对应的播放设备类型;
需要说明的是,播放设备类型是指需要播放音频文件的音响设备的类型,例如:汽车音响、喇叭等。
可理解的是,本实施例可根据待处理特征向量确定待处理音频信号对应的播放设备类型,由于不同的播放设备类型的音质差别较大,所以待处理特征向量的分布情况的差别也较大,因此可根据待处理特征向量的分布情况确定播放设备类型。
步骤S302:根据所述播放设备类型确定所述待处理音频信号中的设备噪声信号;
需要说明的是,设备噪声信号是指播放设备,即音响设备在播放音频时产生的噪声信号。
应理解的是,本实施例可根据播放设备类型确定待处理音频信号中的设备噪声信号,播放设备噪声可以是在播放设备出厂前自身携带的噪声,由于每一种播放设备类型对应产生的噪声可能都不相同,音质较好的播放设备产生的噪声较少,所以可根据播放设备类型确定待处理音频信号中的设备噪声信号。
步骤S303:根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的原始噪声信号;
在具体实现中,本实施例可根据原始特征向量和待处理特征向量确定待处理音频信号中的原始噪声信号,具体可将原始特征向量和待处理特征向量进行对比,如果两者之间差别较大,则将待处理特征向量中差别较大的向量部分对应的信号作为原始噪声信号。
进一步地,为了精确确定原始噪声信号,在本实施例中,所述步骤S303包括:将所述原始特征向量和所述待处理特征向量进行频率划分,获得划分后的原始特征向量和划分后的待处理特征向量;获取相同频率范围内的原始特征向量和待处理特征向量之间的相似度;根据所述相似度确定所述待处理特征向量中的异常特征向量;根据所述异常特征向量确定所述待处理音频信号中的原始噪声信号。
可理解的是,本实施例可将原始特征向量和待处理特征向量按照频率划分,可得到不同频率范围内的原始特征向量和不同频率范围内的待处理特征向量。
应理解的是,可获取相同频率范围内的原始特征向量和待处理特征向量之间的相似度,具体计算相似度的方式可以参照现有技术中计算向量相似度的方法,本实施例对此不过多赘述。
在具体实现中,在相似度大于预设阈值时,该频率范围内的待处理特征向量为异常特征向量,预设阈值是指预先设置的阈值,具体可根据实际情况设置,本实施例对此不作具体限制。然后将异常特征向量对应的待处理音频信号作为原始噪声信号。
步骤S304:根据所述原始噪声信号和所述设备噪声信号确定所述待处理音频信号中的噪声信号。
可理解的是,将原始噪声信号和设备噪声信号进行叠加可得到待处理音频信号中的噪声信号。
本实施例根据待处理特征向量确定待处理音频信号对应的播放设备类型,然后根据播放设备类型确定待处理音频信号中的设备噪声信号,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的原始噪声信号,再根据原始噪声信号和设备噪声信号确定待处理音频信号中的噪声信号。本实施例根据原始噪声信号和设备噪声信号确定待处理音频信号中的噪声信号,原始噪声信号根据原始特征向量和待处理特征向量确定,设备噪声信号根据播放设备类型确定,能够得到精确的噪声信号,从而能够精确地对经过音响设备初次播放后的待处理音频信号进行降噪处理,有效地降低音响设备产生的噪声。
参照图6,图6为本发明降噪控制装置第一实施例的结构框图。
如图6所示,本发明实施例提出的降噪控制装置包括:
信号获取模块10,用于获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号;
特征提取模块20,用于将所述原始音频信号和所述待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量;
信号确定模块30,用于根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号;
降噪处理模块40,用于根据所述噪声信号对所述待处理音频信号进行降噪处理。
本实施例通过获取原始音频文件对应的原始音频信号和原始音频文件初次播放后的待处理音频信号,然后将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,再根据噪声信号对待处理音频信号进行降噪处理。本实施例通过将原始音频信号和待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量,能够得到原始音频信号对应的特征向量和经过音响设备初次播放后的待处理音频信号对应的特征向量,然后根据原始特征向量和待处理特征向量确定待处理音频信号中的噪声信号,能够精确地得到音频文件经过音响设备初次播放后的噪声信号,并根据噪声信号对待处理音频信号进行降噪处理,从而能够对经过降噪处理后的待处理音频信号进行再次播放,有效地降低音响设备产生的噪声。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的降噪控制方法,此处不再赘述。
基于本发明上述降噪控制装置第一实施例,提出本发明降噪控制装置的第二实施例。
在本实施例中,所述信号获取模块10,还用于获取原始音频文件中的音频数据和所述原始音频文件对应的文件格式;根据所述音频数据和所述文件格式判断所述原始音频文件是否需要修复;若是,则对所述原始音频文件中的待修复区域进行标记,获得携带标记的音频文件。
进一步地,所述信号获取模块10,还用于将所述文件格式与所述音频数据对应的采样频率和采样大小进行匹配;若匹配通过,则获取所述音频数据中的各帧音频数据;获取所述各帧音频数据中的缺失数据对应的目标帧音频数据;根据所述目标帧音频数据判断所述原始音频文件是否需要修复。
进一步地,所述信号获取模块10,还用于根据所述原始音频文件从预设音频库中选取目标音频文件;选取所述音频文件中携带标记的待修复区域,并根据所述目标音频文件对所述待修复区域进行优化,获得优化后的音频文件;获取所述优化后的音频文件对应的原始音频信号和所述优化后的音频文件初次播放后的待处理音频信号。
进一步地,所述信号获取模块10,还用于根据所述待处理特征向量确定所述待处理音频信号对应的播放设备类型;根据所述播放设备类型确定所述待处理音频信号中的设备噪声信号;根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的原始噪声信号;根据所述原始噪声信号和所述设备噪声信号确定所述待处理音频信号中的噪声信号。
进一步地,所述信号确定模块30,还用于将所述原始特征向量和所述待处理特征向量进行频率划分,获得划分后的原始特征向量和划分后的待处理特征向量;获取相同频率范围内的原始特征向量和待处理特征向量之间的相似度;根据所述相似度确定所述待处理特征向量中的异常特征向量;根据所述异常特征向量确定所述待处理音频信号中的原始噪声信号。
进一步地,所述信号确定模块30,还用于对所述噪声信号进行音质分析,获得音质分析结果;根据所述音质分析结果确定所述待处理音频信号的优化方式;根据所述优化方式对所述待处理音频信号进行降噪处理。
本发明降噪控制装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有降噪控制程序,所述降噪控制程序被处理器执行时实现如上文所述的降噪控制方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光 盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种降噪控制方法,其特征在于,所述降噪控制方法包括以下步骤:
获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号;
将所述原始音频信号和所述待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量;
根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号;
根据所述噪声信号对所述待处理音频信号进行降噪处理。
2.如权利要求1所述的降噪控制方法,其特征在于,所述获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号的步骤之前,还包括:
获取原始音频文件中的音频数据和所述原始音频文件对应的文件格式;
根据所述音频数据和所述文件格式判断所述原始音频文件是否需要修复;
若是,则对所述原始音频文件中的待修复区域进行标记,获得携带标记的音频文件。
3.如权利要求2所述的降噪控制方法,其特征在于,所述根据所述音频数据和所述文件格式判断所述原始音频文件是否需要修复的步骤,具体包括:
将所述文件格式与所述音频数据对应的采样频率和采样大小进行匹配;
若匹配通过,则获取所述音频数据中的各帧音频数据;
获取所述各帧音频数据中的缺失数据对应的目标帧音频数据;
根据所述目标帧音频数据判断所述原始音频文件是否需要修复。
4.如权利要求2所述的降噪控制方法,其特征在于,所述获取音频文件对应的原始音频信号和所述音频文件初次播放后的待处理音频信号的步骤,具体包括:
根据所述原始音频文件从预设音频库中选取目标音频文件;
选取所述音频文件中携带标记的待修复区域,并根据所述目标音频文件对所述待修复区域进行优化,获得优化后的音频文件;
获取所述优化后的音频文件对应的原始音频信号和所述优化后的音频文件初次播放后的待处理音频信号。
5.如权利要求1所述的降噪控制方法,其特征在于,所述根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号的步骤,具体包括:
根据所述待处理特征向量确定所述待处理音频信号对应的播放设备类型;
根据所述播放设备类型确定所述待处理音频信号中的设备噪声信号;
根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的原始噪声信号;
根据所述原始噪声信号和所述设备噪声信号确定所述待处理音频信号中的噪声信号。
6.如权利要求5所述的降噪控制方法,其特征在于,所述根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的原始噪声信号的步骤,具体包括:
将所述原始特征向量和所述待处理特征向量进行频率划分,获得划分后的原始特征向量和划分后的待处理特征向量;
获取相同频率范围内的原始特征向量和待处理特征向量之间的相似度;
根据所述相似度确定所述待处理特征向量中的异常特征向量;
根据所述异常特征向量确定所述待处理音频信号中的原始噪声信号。
7.如权利要求1~6中任一项所述的降噪控制方法,其特征在于,所述根据所述噪声信号对所述待处理音频信号进行降噪处理的步骤,具体包括:
对所述噪声信号进行音质分析,获得音质分析结果;
根据所述音质分析结果确定所述待处理音频信号的优化方式;
根据所述优化方式对所述待处理音频信号进行降噪处理。
8.一种降噪控制装置,其特征在于,所述降噪控制装置包括:
信号获取模块,用于获取音频文件对应的原始音频信号和所述音频文件播放后的待处理音频信号;
特征提取模块,用于将所述原始音频信号和所述待处理音频信号输入至预设语音特征提取网络中,获得原始特征向量和待处理特征向量;
信号确定模块,用于根据所述原始特征向量和所述待处理特征向量确定所述待处理音频信号中的噪声信号;
降噪处理模块,用于根据所述噪声信号对所述待处理音频信号进行降噪处理。
9.一种降噪控制设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的降噪控制程序,所述降噪控制程序配置为实现如权利要求1至7中任一项所述的降噪控制方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有降噪控制程序,所述降噪控制程序被处理器执行时实现如权利要求1至7中任一项所述的降噪控制方法的步骤。
CN202310248810.8A 2023-03-15 2023-03-15 降噪控制方法、装置、设备及存储介质 Active CN115938382B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310248810.8A CN115938382B (zh) 2023-03-15 2023-03-15 降噪控制方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310248810.8A CN115938382B (zh) 2023-03-15 2023-03-15 降噪控制方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115938382A true CN115938382A (zh) 2023-04-07
CN115938382B CN115938382B (zh) 2023-06-02

Family

ID=85822093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310248810.8A Active CN115938382B (zh) 2023-03-15 2023-03-15 降噪控制方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115938382B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090129610A1 (en) * 2007-11-15 2009-05-21 Samsung Electronics Co., Ltd. Method and apparatus for canceling noise from mixed sound
US20150081287A1 (en) * 2013-09-13 2015-03-19 Advanced Simulation Technology, inc. ("ASTi") Adaptive noise reduction for high noise environments
US20170092268A1 (en) * 2015-09-28 2017-03-30 Trausti Thor Kristjansson Methods for speech enhancement and speech recognition using neural networks
US20190130930A1 (en) * 2017-10-27 2019-05-02 Bestechnic (Shanghai) Co., Ltd. Active noise control headphones
CN111883152A (zh) * 2020-06-23 2020-11-03 海信视像科技股份有限公司 一种音频信号处理方法和一种电子设备
CN113571035A (zh) * 2021-06-18 2021-10-29 荣耀终端有限公司 降噪方法及降噪装置
CN113596661A (zh) * 2021-07-28 2021-11-02 维沃移动通信有限公司 耳机、反馈降噪方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090129610A1 (en) * 2007-11-15 2009-05-21 Samsung Electronics Co., Ltd. Method and apparatus for canceling noise from mixed sound
US20150081287A1 (en) * 2013-09-13 2015-03-19 Advanced Simulation Technology, inc. ("ASTi") Adaptive noise reduction for high noise environments
US20170092268A1 (en) * 2015-09-28 2017-03-30 Trausti Thor Kristjansson Methods for speech enhancement and speech recognition using neural networks
US20190130930A1 (en) * 2017-10-27 2019-05-02 Bestechnic (Shanghai) Co., Ltd. Active noise control headphones
CN111883152A (zh) * 2020-06-23 2020-11-03 海信视像科技股份有限公司 一种音频信号处理方法和一种电子设备
CN113571035A (zh) * 2021-06-18 2021-10-29 荣耀终端有限公司 降噪方法及降噪装置
CN113596661A (zh) * 2021-07-28 2021-11-02 维沃移动通信有限公司 耳机、反馈降噪方法及装置

Also Published As

Publication number Publication date
CN115938382B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN107910011B (zh) 一种语音降噪方法、装置、服务器及存储介质
MXPA04009077A (es) Metodo para el reconocimiento de voz fuerte analizando caracteristicas redundantes de la senal de origen.
CN110706719B (zh) 一种语音提取方法、装置、电子设备及存储介质
CN112053702B (zh) 一种语音处理的方法、装置及电子设备
CN110970051A (zh) 语音数据采集方法、终端及可读存储介质
CN116564332A (zh) 频响分析方法、装置、设备及存储介质
CN115938382B (zh) 降噪控制方法、装置、设备及存储介质
EP3680901A1 (en) A sound processing apparatus and method
US20230360662A1 (en) Method and device for processing a binaural recording
CN116312559A (zh) 跨信道声纹识别模型的训练方法、声纹识别方法及装置
CN114627889A (zh) 多声源声音信号处理方法及装置、存储介质和电子设备
CN115457973A (zh) 说话人分割方法、系统、终端及存储介质
CN111370017B (zh) 一种语音增强方法、装置、系统
CN111028860B (zh) 音频数据处理方法、装置、计算机设备以及存储介质
CN104078049B (zh) 信号处理设备和信号处理方法
CN111782860A (zh) 一种音频检测方法及装置、存储介质
KR101096091B1 (ko) 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법
CN117153185B (zh) 通话处理方法、装置、计算机设备和存储介质
CN116229986B (zh) 一种针对声纹鉴定任务的语音降噪方法及装置
JP7159767B2 (ja) 音声信号処理プログラム、音声信号処理方法及び音声信号処理装置
CN114360572A (zh) 语音去噪方法、装置、电子设备及存储介质
CN116684812A (zh) 基于相位差的环境声改进方法、装置、设备及存储介质
Kumari et al. Designing Highly Secured Speaker Identification with Audio Fingerprinting using MODWT and RBFNN
KR100565428B1 (ko) 인간 청각 모델을 이용한 부가잡음 제거장치
CN116564357A (zh) 基于多标记的语音活动检测

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant