CN115482835A - 噪声检测方法、装置、电子设备和介质 - Google Patents
噪声检测方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN115482835A CN115482835A CN202211096421.XA CN202211096421A CN115482835A CN 115482835 A CN115482835 A CN 115482835A CN 202211096421 A CN202211096421 A CN 202211096421A CN 115482835 A CN115482835 A CN 115482835A
- Authority
- CN
- China
- Prior art keywords
- data
- noise
- target
- reduction model
- sound data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 29
- 230000009467 reduction Effects 0.000 claims abstract description 96
- 238000012549 training Methods 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000009466 transformation Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 26
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本公开涉及一种噪声检测方法、装置、电子设备和介质;其中,该方法包括:获取在目标环境下采集到的声音数据,声音数据通过单个麦克风采集得到;将声音数据输入至目标降噪模型中,得到目标语音数据,目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到;基于声音数据和目标语音数据,确定噪声数据;根据噪声数据和目标环境对应的噪声阈值的大小关系,确定声音数据是否形成噪声污染。本公开实施例通过目标降噪模型对目标语音数据进行估计,由于目标语音数据成分简单,因此所得到的目标语音数据准确性较高,从而有利于提高根据声音数据和目标语音数据所确定的噪声数据的准确性,进而确定声音数据是否形成噪声污染的结果也更准确。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种噪声检测方法、装置、电子设备和介质。
背景技术
在日常生产生活中,存在着许多种噪声,例如汽车、火车、飞机和船舶等交通工具带来的交通噪声,工业设备和机器等运行时产生的工业噪声,建筑工地上一些机器和施工带来的建筑噪声,日常活动中家用电器和音响等设备发出的社会噪声,等等。因此,对噪声进行检测是非常有必要的。
现有技术中,噪声检测是基于对采集信号的成分进行相关性分析和噪声判定,进而对噪声进行统计,但是该方案对于室外环境下突变性较强的噪声很难准确估计,容易出现误差,从而会影响后续对噪声是否构成污染的判断。
发明内容
为了解决上述技术问题,本公开提供了一种噪声检测方法、装置、电子设备和介质。
第一方面,本公开提供了一种噪声检测方法,包括:
获取在目标环境下采集到的声音数据,所述声音数据通过单个麦克风采集得到;
将所述声音数据输入至目标降噪模型中,得到目标语音数据,所述目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到;
基于所述声音数据和所述目标语音数据,确定噪声数据;
根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染。
可选的,所述将所述声音数据输入至目标降噪模型中,得到目标语音数据,包括:
将所述声音数据进行短时傅里叶变换,得到第一数据;
将所述第一数据输入至所述目标降噪模型,得到第二数据;
将所述第一数据和所述第二数据相乘,得到第三数据;
将所述第三数据进行短时傅里叶逆变换,得到所述目标语音数据。
可选的,所述基于所述声音数据和所述目标语音数据,确定噪声数据,包括:
将所述声音数据和所述目标语音数据相减,得到所述噪声数据。
可选的,所述根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染,包括:
获取所述目标环境对应的所述噪声阈值;
若所述噪声数据大于或等于所述噪声阈值,则确定所述声音数据形成噪声污染;
若所述噪声数据小于所述噪声阈值,则确定所述声音数据未形成噪声污染。
可选的,所述确定所述声音数据形成噪声污染之后,还包括:
通过预设方式进行噪声污染提醒。
可选的,所述目标降噪模型通过以下方式训练得到:
获取训练样本集,所述训练样本集中包括在多种环境下采集到的多个包含噪声的数据;
基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型。
可选的,所述基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型,包括:
确定所述预设损失函数对应的损失值;
基于所述损失值,调整所述预设降噪模型的参数,直至所述预设降噪模型收敛,得到所述目标降噪模型。
第二方面,本公开提供了一种噪声检测装置,包括:
获取模块,用于获取在目标环境下采集到的声音数据,所述声音数据通过单个麦克风采集得到;
第一确定模块,用于将所述声音数据输入至目标降噪模型中,得到目标语音数据,所述目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到;
第二确定模块,用于基于所述声音数据和所述目标语音数据,确定噪声数据;
第三确定模块,用于根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染。
可选的,第一确定模块,具体用于:
将所述声音数据进行短时傅里叶变换,得到第一数据;
将所述第一数据输入至所述目标降噪模型,得到第二数据;
将所述第一数据和所述第二数据相乘,得到第三数据;
将所述第三数据进行短时傅里叶逆变换,得到所述目标语音数据。
可选的,第二确定模块,具体用于:
将所述声音数据和所述目标语音数据相减,得到所述噪声数据。
可选的,第三确定模块,具体用于:
获取所述目标环境对应的所述噪声阈值;
若所述噪声数据大于或等于所述噪声阈值,则确定所述声音数据形成噪声污染;
若所述噪声数据小于所述噪声阈值,则确定所述声音数据未形成噪声污染。
可选的,上述装置还包括:提醒模块,具体用于:
在确定所述声音数据形成噪声污染之后,通过预设方式进行噪声污染提醒。
可选的,所述目标降噪模型通过以下方式训练得到:
获取训练样本集,所述训练样本集中包括在多种环境下采集到的多个包含噪声的数据;
基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型。
可选的,所述基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型,包括:
确定所述预设损失函数对应的损失值;
基于所述损失值,调整所述预设降噪模型的参数,直至所述预设降噪模型收敛,得到所述目标降噪模型。
第三方面,本公开还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本公开实施例中的任一种所述的噪声检测方法。
第四方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开实施例中的任一种所述的噪声检测方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:首先获取在目标环境下采集到的声音数据,声音数据通过单个麦克风采集得到,接着将声音数据输入至目标降噪模型中,得到目标语音数据,目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到,然后基于声音数据和目标语音数据,确定噪声数据,最后根据噪声数据和目标环境对应的噪声阈值的大小关系,确定声音数据是否形成噪声污染,上述方案中通过目标降噪模型对目标语音数据进行估计,由于目标语音数据成分简单,因此所得到的目标语音数据准确性较高,从而有利于提高根据声音数据和目标语音数据所确定的噪声数据的准确性,进而确定声音数据是否形成噪声污染的结果也更准确。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种噪声检测方法的流程示意图;
图2A是本公开实施例提供的另一种噪声检测方法的流程示意图;
图2B是本公开实施例提供的一种得到目标语音数据的过程的原理示意图;
图2C是本公开实施例提供的一种确定噪声数据的过程的原理示意图;
图3是本公开实施例提供的一种噪声检测装置的结构示意图;
图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
图1是本公开实施例提供的一种噪声检测方法的流程示意图。本实施例可适用于对声音数据中的噪声进行估计,并确定声音数据是否形成噪声污染的情况。本实施例方法可由噪声检测装置来执行,该装置可采用硬件/或软件的方式来实现,并可配置于电子设备中。如图1所示,该方法具体包括如下:
S110,获取在目标环境下采集到的声音数据,声音数据通过单个麦克风采集得到。
其中,目标环境可以为预先确定的环境,例如十字路口环境、室内环境、地铁口环境以及飞机场附近的住宅区环境等,还可以视具体情况而定,本实施例对此不做限定。单个麦克风为布置在目标环境中的单个声音采集设备,主要用于对目标环境进行环境声音的采集。
在人们的日常生产生活中,可能处处都存在着噪声。人们如果长时间处在噪声比较严重的环境下,轻则影响日常休息,重则有可能会对听力造成不可逆的损伤,诱发多种疾病。因此,确定声音数据中包含的噪声是否形成噪声污染是非常有必要的。由于噪声覆盖的场景多样、类型复杂且时间不固定,因此需要对噪声进行检测。
为了对噪声进行检测,需要获取在目标环境下通过单个麦克风采采集到的声音数据,以便后续基于该声音数据,确定该声音数据中所包含的噪声数据。
S120,将声音数据输入至目标降噪模型中,得到目标语音数据,目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到。目标语音数据可以理解为声音数据中包含的未构成噪声的数据(即非噪声数据),例如在十字路口环境中,车辆的鸣笛声、喇叭声以及施工的机器声等为噪声数据,路人说话的声音则为非噪声数据;又如在图书馆环境中,小于预设分贝值的交谈声为非噪声数据,大于或等于预设分贝值的交谈声、公放的音乐声则为噪声数据,其中,预设分贝值可以预先设定,也可以视具体情况而定,本实施例对此不做限定。
其中,目标降噪模型可以为深度学习降噪模型中的任意一种,例如卷积神经网络(Convolutional Neural Networks,CNN)降噪模型、循环神经网络(Recurrent neuralnetworks,RNN)降噪模型、长短期记忆网络(Long short term memory,LSTM)降噪模型以及生成对抗网络(Generative adversarial networks,GAN)降噪模型等,本实施例对此不做限定。
在得到声音数据之后,将声音数据输入至目标降噪模型中,由于目标降噪模型是通过在多种环境下采集到的多个包含噪声的数据训练得到的,且目标语音数据相比噪声数据而言,成分比较简单,因此通过该目标降噪模型能够得到准确的目标语音数据,即:保留目标语音数据,抑制噪声数据,相比于直接获取噪声数据而言,目标语音数据更容易获取,并且目标降噪模型的结构相比于噪声估计模型也更简单。
S130,基于声音数据和目标语音数据,确定噪声数据。
由于声音数据中包含了目标语音数据和噪声数据,因此,在得到目标语音数据之后,能够确定出噪声数据。
S140,根据噪声数据和目标环境对应的噪声阈值的大小关系,确定声音数据是否形成噪声污染。
其中,噪声阈值可以预先设定,也可以视具体情况而定,本实施例对此不做限定。
由于不同的目标环境对应的噪声判断标准不同,针对不同的目标环境灵活设定不同的噪声阈值,比较噪声数据和目标环境对应的噪声阈值的大小,根据二者的大小关系,能够确定在目标环境下采集到的声音数据是否形成噪声污染,从而有利于后续采取相应的防治措施,避免给人体造成伤害。
在本实施例中,首先获取在目标环境下采集到的声音数据,声音数据通过单个麦克风采集得到,接着将声音数据输入至目标降噪模型中,得到目标语音数据,目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到,然后基于声音数据和目标语音数据,确定噪声数据,最后根据噪声数据和目标环境对应的噪声阈值的大小关系,确定声音数据是否形成噪声污染,上述方案中通过目标降噪模型对目标语音数据进行估计,由于目标语音数据成分简单,因此所得到的目标语音数据准确性较高,从而有利于提高根据声音数据和目标语音数据所确定的噪声数据的准确性,进而确定声音数据是否形成噪声污染的结果也更准确。
在本实施例中,可选的,所述根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染,可以具体包括:
获取所述目标环境对应的所述噪声阈值;
若所述噪声数据大于或等于所述噪声阈值,则确定所述声音数据形成噪声污染;
若所述噪声数据小于所述噪声阈值,则确定所述声音数据未形成噪声污染。
具体的,在判断声音数据是否形成噪声污染时,需要获取目标环境对应的噪声阈值,以便比较噪声数据和噪声阈值的大小,如果噪声数据大于或等于噪声阈值,则说明该噪声数据会对人们产生不利的影响,因此能够确定声音数据形成噪声污染,需要采取相应的措施来降低该噪声数据,同时,可以基于该噪声数据输出报警信号至噪声后台监控系统;相反,如果噪声数据小于噪声阈值,则说明该噪声数据不会对人们产生不利的影响,因此能够确定声音数据未形成噪声污染,可以将该噪声数据传输至噪声后台监控系统,进行显示。
本实施例中,通过上述方法确定在目标环境下采集到的声音数据是否形成噪声污染,能够决定后续是否采取相应的防治措施,避免给人体造成伤害,有利于人们的身心健康,以及避免对环境噪声污染。
在本实施例中,可选的,所述确定所述声音数据形成噪声污染之后,还可以具体包括:
通过预设方式进行噪声污染提醒。
其中,预设方式可以为对目标环境内的人们发送手机短信进行噪声污染提醒,还可以为对噪声来源的个人、企业或者单位进行噪声污染提醒,本实施例对此不做限定。
本实施例中,通过上述方式进行噪声污染提醒,有利于后续采取相应的防治措施降低噪声,避免噪声对环境和人们的不利影响。
在本实施例中,可选的,所述目标降噪模型可以通过以下方式训练得到:
获取训练样本集,所述训练样本集中包括在多种环境下采集到的多个包含噪声的数据;
基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型。
其中,预设损失函数可以为余弦损失函数、联结时序分类(ConnectionistTemporal Classification,CTC)损失函数、多分类交叉熵损失函数以及均方损失函数等,预设损失函数可以根据实际使用需求确定,还可以通过用户自定义设置,本公开实施例不做限定。
具体的,通过在在多种互不相同的环境下分别布置的单个麦克风能够采集到各环境下分别对应的包含噪声的数据,即:多个训练样本,基于这些数据能够形成训练样本集。在得到训练样本集之后,由于预设损失函数为目标降噪模型是否训练合格的衡量标准,因此,通过预设损失函数计算基于预设降噪模型得到的目标语音数据与训练样本集中的样本所对应的实际语音数据的相似性,能够验证目标降噪模型的识别精度,以训练出准确度高的目标降噪模型,从而,有效保证训练得到的目标降噪模型具有较高精度的输出结果。
在本公开实施例中,还可以将获取的训练样本集分为训练集和验证集,利用训练集对预设降噪模型进行训练,得到目标降噪模型,再用验证集对得到的目标降噪模型进行验证,若验证合格,则得到训练后的目标降噪模型。
本实施例中,通过上述方法训练得到目标降噪模型,能够对不同环境下的目标语音数据进行估计,适应不同的目标环境,在得到目标声音数据之后,尤其有利于对室外环境下突变性较强的噪声进行估计。
在本实施例中,可选的,所述基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型,可以具体包括:
确定所述预设损失函数对应的损失值;
基于所述损失值,调整所述预设降噪模型的参数,直至所述预设降噪模型收敛,得到所述目标降噪模型。
具体的,通过预设损失函数能够计算基于预设降噪模型得到的目标语音数据与训练样本集中的样本所对应的实际语音数据之间的损失值,根据该损失值,调整预设降噪模型的参数,直至预设降噪模型收敛,得到目标降噪模型。
本实施例中,通过上述方法得到目标降噪模型简单高效,有利于提高目标语音数据的准确性。
图2A是本公开实施例提供的另一种噪声检测方法的流程示意图。本实施例是在上述实施例的基础上进行优化。可选的,本实施例对得到目标语音数据的过程进行详细的解释说明。如图2A所示,该方法具体包括如下:
S110,获取在目标环境下采集到的声音数据,声音数据通过单个麦克风采集得到。
S1201,将声音数据进行短时傅里叶变换,得到第一数据。
其中,短时傅里叶变换(Short-time Fourier Transform,STFT)的原理是:选择一个时频局部化的窗函数,假定窗函数在一个短时间间隔内是平稳(伪平稳)的,移动窗函数,计算出原始信号在各个不同时刻的功率谱。
由于声音数据不易分析,因此将声音数据进行短时傅里叶变换,得到第一数据,即:得到声音数据在各个不同时刻的功率谱,便于后续从声音数据中确定出目标语音数据。
S1202,将第一数据输入至目标降噪模型,得到第二数据。
在得到第一数据之后,将第一数据输入至目标降噪模型,能够得到该目标降噪模型估计出的第二数据。
S1203,将第一数据和第二数据相乘,得到第三数据。
将第一数据和第二数据相乘,就能够得到第三数据。
S1204,将第三数据进行短时傅里叶逆变换,得到目标语音数据。
其中,短时傅立叶逆变换(Inverse Short-time Fourier Transform,ISTFT)是短时傅立叶变换的逆变换,能够将功率谱转换为与原始信号相同的信号格式。
由于声音数据进行了短时傅里叶变换,因此为了保持信号的一致性,在得到第三数据之后,将第三数据进行短时傅里叶逆变换,就能够得到目标语音数据。
S130,基于声音数据和目标语音数据,确定噪声数据。
S140,根据噪声数据和目标环境对应的噪声阈值的大小关系,确定声音数据是否形成噪声污染。
在本实施例中,首先获取在目标环境下采集到的声音数据,声音数据通过单个麦克风采集得到,接着将声音数据进行短时傅里叶变换,得到第一数据,将第一数据输入至目标降噪模型,得到第二数据,将第一数据和第二数据相乘,得到第三数据,将第三数据进行短时傅里叶逆变换,得到目标语音数据,然后基于声音数据和目标语音数据,确定噪声数据,最后根据噪声数据和目标环境对应的噪声阈值的大小关系,确定声音数据是否形成噪声污染,上述方案中,通过短时傅里叶变换和短时傅里叶逆变换,更有利于对声音数据的信号处理,使得基于目标降噪模型得到的目标语音数据更准确,进而提高噪声数据的准确性,以及声音数据是否形成噪声污染的结果也更准确。
示例性的,图2B是本公开实施例提供的一种得到目标语音数据的过程的原理示意图。如图2B所示,得到目标语音数据的过程已经在上述实施例中详细描述过,为了避免重复,此处不再赘述。
在本实施例中,可选的,所述基于所述声音数据和所述目标语音数据,确定噪声数据,包括:
将所述声音数据和所述目标语音数据相减,得到所述噪声数据。
本实施例中,由于声音数据中包含了目标语音数据和噪声数据,因此,在得到目标语音数据之后,将声音数据减去目标语音数据,就能够得到噪声数据。
本实施例中,通过上述方法确定噪声数据,有利于简化模型的构造,节省模型训练的时间,并且由于目标语音数据成分简单,更有利于估计,因此,相比于直接通过模型估计的噪声数据,本实施例中得到的噪声数据误差更小,且方法也比较简单。
示例性的,图2C是本公开实施例提供的一种确定噪声数据的过程的原理示意图。如图2C所示,确定噪声数据的过程已经在上述实施例中详细描述过,为了避免重复,此处不再赘述。
图3是本公开实施例提供的一种噪声检测装置的结构示意图;该装置配置于电子设备中,可实现本申请任意实施例所述的噪声检测方法。该装置具体包括如下:
获取模块310,用于获取在目标环境下采集到的声音数据,所述声音数据通过单个麦克风采集得到;
第一确定模块320,用于将所述声音数据输入至目标降噪模型中,得到目标语音数据,所述目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到;
第二确定模块330,用于基于所述声音数据和所述目标语音数据,确定噪声数据;
第三确定模块340,用于根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染。
在本实施例中,可选的,第一确定模块320,具体用于:
将所述声音数据进行短时傅里叶变换,得到第一数据;
将所述第一数据输入至所述目标降噪模型,得到第二数据;
将所述第一数据和所述第二数据相乘,得到第三数据;
将所述第三数据进行短时傅里叶逆变换,得到所述目标语音数据。
在本实施例中,可选的,第二确定模块330,具体用于:
将所述声音数据和所述目标语音数据相减,得到所述噪声数据。
在本实施例中,可选的,第三确定模块340,具体用于:
获取所述目标环境对应的所述噪声阈值;
若所述噪声数据大于或等于所述噪声阈值,则确定所述声音数据形成噪声污染;
若所述噪声数据小于所述噪声阈值,则确定所述声音数据未形成噪声污染。
在本实施例中,可选的,上述装置还包括:提醒模块,具体用于:
在确定所述声音数据形成噪声污染之后,通过预设方式进行噪声污染提醒。
在本实施例中,可选的,所述目标降噪模型通过以下方式训练得到:
获取训练样本集,所述训练样本集中包括在多种环境下采集到的多个包含噪声的数据;
基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型。
在本实施例中,可选的,所述基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型,包括:
确定所述预设损失函数对应的损失值;
基于所述损失值,调整所述预设降噪模型的参数,直至所述预设降噪模型收敛,得到所述目标降噪模型。
通过本公开实施例提供的噪声检测装置,首先获取在目标环境下采集到的声音数据,声音数据通过单个麦克风采集得到,接着将声音数据输入至目标降噪模型中,得到目标语音数据,目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到,然后基于声音数据和目标语音数据,确定噪声数据,最后根据噪声数据和目标环境对应的噪声阈值的大小关系,确定声音数据是否形成噪声污染,上述方案中通过目标降噪模型对目标语音数据进行估计,由于目标语音数据成分简单,因此所得到的目标语音数据准确性较高,从而有利于提高根据声音数据和目标语音数据所确定的噪声数据的准确性,进而确定声音数据是否形成噪声污染的结果也更准确。
本公开实施例所提供的噪声检测装置可执行本公开任意实施例所提供的噪声检测方法,具备执行方法相应的功能模块和有益效果。
图4是本公开实施例提供的一种电子设备的结构示意图。如图4所示,该电子设备包括处理器410和存储装置420;电子设备中处理器410的数量可以是一个或多个,图4中以一个处理器410为例;电子设备中的处理器410和存储装置420可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储装置420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本公开实施例中的噪声检测方法对应的程序指令/模块。处理器410通过运行存储在存储装置420中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现本公开实施例所提供的噪声检测方法。
存储装置420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本实施例提供的一种电子设备可用于执行上述任意实施例提供的噪声检测方法,具备相应的功能和有益效果。
本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于实现本公开实施例所提供的噪声检测方法。
当然,本公开实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本公开任意实施例所提供的噪声检测方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本公开可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述的方法。
值得注意的是,上述噪声检测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种噪声检测方法,其特征在于,所述方法包括:
获取在目标环境下采集到的声音数据,所述声音数据通过单个麦克风采集得到;
将所述声音数据输入至目标降噪模型中,得到目标语音数据,所述目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到;
基于所述声音数据和所述目标语音数据,确定噪声数据;
根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染。
2.根据权利要求1所述的方法,其特征在于,所述将所述声音数据输入至目标降噪模型中,得到目标语音数据,包括:
将所述声音数据进行短时傅里叶变换,得到第一数据;
将所述第一数据输入至所述目标降噪模型,得到第二数据;
将所述第一数据和所述第二数据相乘,得到第三数据;
将所述第三数据进行短时傅里叶逆变换,得到所述目标语音数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述声音数据和所述目标语音数据,确定噪声数据,包括:
将所述声音数据和所述目标语音数据相减,得到所述噪声数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染,包括:
获取所述目标环境对应的所述噪声阈值;
若所述噪声数据大于或等于所述噪声阈值,则确定所述声音数据形成噪声污染;
若所述噪声数据小于所述噪声阈值,则确定所述声音数据未形成噪声污染。
5.根据权利要求4所述的方法,其特征在于,所述确定所述声音数据形成噪声污染之后,还包括:
通过预设方式进行噪声污染提醒。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述目标降噪模型通过以下方式训练得到:
获取训练样本集,所述训练样本集中包括在多种环境下采集到的多个包含噪声的数据;
基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型。
7.根据权利要求6所述的方法,其特征在于,所述基于预设损失函数,根据所述训练样本集对预设降噪模型进行训练,得到所述目标降噪模型,包括:
确定所述预设损失函数对应的损失值;
基于所述损失值,调整所述预设降噪模型的参数,直至所述预设降噪模型收敛,得到所述目标降噪模型。
8.一种噪声检测装置,其特征在于,所述装置包括:
获取模块,用于获取在目标环境下采集到的声音数据,所述声音数据通过单个麦克风采集得到;
第一确定模块,用于将所述声音数据输入至目标降噪模型中,得到目标语音数据,所述目标降噪模型通过在多种环境下采集到的多个包含噪声的数据训练得到;
第二确定模块,用于基于所述声音数据和所述目标语音数据,确定噪声数据;
第三确定模块,用于根据所述噪声数据和所述目标环境对应的噪声阈值的大小关系,确定所述声音数据是否形成噪声污染。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211096421.XA CN115482835A (zh) | 2022-09-06 | 2022-09-06 | 噪声检测方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211096421.XA CN115482835A (zh) | 2022-09-06 | 2022-09-06 | 噪声检测方法、装置、电子设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115482835A true CN115482835A (zh) | 2022-12-16 |
Family
ID=84424064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211096421.XA Pending CN115482835A (zh) | 2022-09-06 | 2022-09-06 | 噪声检测方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115482835A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116540178A (zh) * | 2023-04-28 | 2023-08-04 | 广东顺德西安交通大学研究院 | 一种音视频融合的噪声源定位方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000014731A1 (en) * | 1998-09-09 | 2000-03-16 | Ericsson Inc. | Apparatus and method for transmitting an improved voice signal over a communications device located in a vehicle with adaptive vibration noise cancellation |
CN105547466A (zh) * | 2015-12-10 | 2016-05-04 | 防城港思创信息技术有限公司 | 一种噪声污染监控方法 |
CN105719657A (zh) * | 2016-02-23 | 2016-06-29 | 惠州市德赛西威汽车电子股份有限公司 | 基于单麦克风的人声提取方法及装置 |
CN109190911A (zh) * | 2018-08-07 | 2019-01-11 | 刘明土 | 对施工现场环保措施进行监测的方法及装置 |
CN112216300A (zh) * | 2020-09-25 | 2021-01-12 | 三一专用汽车有限责任公司 | 用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车 |
CN112885366A (zh) * | 2021-01-18 | 2021-06-01 | 宇龙计算机通信科技(深圳)有限公司 | 主动降噪方法、装置、存储介质以及终端 |
CN113470685A (zh) * | 2021-07-13 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 语音增强模型的训练方法和装置及语音增强方法和装置 |
-
2022
- 2022-09-06 CN CN202211096421.XA patent/CN115482835A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000014731A1 (en) * | 1998-09-09 | 2000-03-16 | Ericsson Inc. | Apparatus and method for transmitting an improved voice signal over a communications device located in a vehicle with adaptive vibration noise cancellation |
CN105547466A (zh) * | 2015-12-10 | 2016-05-04 | 防城港思创信息技术有限公司 | 一种噪声污染监控方法 |
CN105719657A (zh) * | 2016-02-23 | 2016-06-29 | 惠州市德赛西威汽车电子股份有限公司 | 基于单麦克风的人声提取方法及装置 |
CN109190911A (zh) * | 2018-08-07 | 2019-01-11 | 刘明土 | 对施工现场环保措施进行监测的方法及装置 |
CN112216300A (zh) * | 2020-09-25 | 2021-01-12 | 三一专用汽车有限责任公司 | 用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车 |
CN112885366A (zh) * | 2021-01-18 | 2021-06-01 | 宇龙计算机通信科技(深圳)有限公司 | 主动降噪方法、装置、存储介质以及终端 |
CN113470685A (zh) * | 2021-07-13 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 语音增强模型的训练方法和装置及语音增强方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116540178A (zh) * | 2023-04-28 | 2023-08-04 | 广东顺德西安交通大学研究院 | 一种音视频融合的噪声源定位方法及系统 |
CN116540178B (zh) * | 2023-04-28 | 2024-02-20 | 广东顺德西安交通大学研究院 | 一种音视频融合的噪声源定位方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10063965B2 (en) | Sound source estimation using neural networks | |
CN108899044B (zh) | 语音信号处理方法及装置 | |
CN106203380B (zh) | 超声波手势识别方法及系统 | |
Zhao et al. | Audio splicing detection and localization using environmental signature | |
Lei et al. | Speech enhancement for in‐vehicle voice control systems using wavelet analysis and blind source separation | |
Talmon et al. | Single-channel transient interference suppression with diffusion maps | |
CN110363120B (zh) | 基于振动信号的智能终端触碰认证方法及系统 | |
Yu et al. | Metricnet: Towards improved modeling for non-intrusive speech quality assessment | |
Al-Karawi et al. | Early reflection detection using autocorrelation to improve robustness of speaker verification in reverberant conditions | |
CN109997186B (zh) | 一种用于分类声环境的设备和方法 | |
CN111613243B (zh) | 一种语音检测的方法及其装置 | |
CN115482835A (zh) | 噪声检测方法、装置、电子设备和介质 | |
CN106033669A (zh) | 语音识别方法及装置 | |
CN113472390A (zh) | 一种基于深度学习的跳频信号参数估计方法 | |
Moore et al. | Room identification using roomprints | |
Liu et al. | Simple pooling front-ends for efficient audio classification | |
CN114664315A (zh) | 一种基于噪声背景的信号提取方法及装置 | |
CN112185425A (zh) | 音频信号处理方法、装置、设备及存储介质 | |
Fathima et al. | Gammatone cepstral coefficient for speaker Identification | |
CN113096691A (zh) | 检测方法、装置、设备和计算机存储介质 | |
WO2018001125A1 (zh) | 一种音频识别方法和装置 | |
CN107894837A (zh) | 动态情感分析模型样本处理方法及装置 | |
CN110556128A (zh) | 一种语音活动性检测方法、设备及计算机可读存储介质 | |
CN104318931B (zh) | 一种音频文件的情绪活跃度获取方法及分类方法、装置 | |
Ghasemi et al. | A new approach for speech enhancement based on eigenvalue spectral subtraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |